因為我算是半路出家的數據分析師,因此工作中參雜了資料工程與數據分析,有點像是包辦了從找資料、清資料、存資料、取資料、整理資料、分析資料到視覺化資料、產出dashboard的流程。
但工作內容比較少用到統計跟機器學習的部分,因此想用這30天把所學記錄起來,看自己可以用工作之餘進修多少內容。
因此,本發文內容裡面主要會包含機器學習、統計跟視覺化的內容。
主要使用spyder、利用Python進行數據分析、機器學習實戰進行。如果過程中有用到的library或是其他書籍資源會一併附上。
以下是預定要介紹的項目,並會搭配用Python實做。
-----基本介紹
機器學習基礎
-----分類-----
k-近鄰算法
決策樹
Logistic回歸
貝氏定理
支持向量機
AdaBoost元算法
-----回歸預測-----
回歸
樹回歸
-----非監督學習-----
K均值
Aprior算法
FP-growth
-----其他工具-----
PCA
SVD
最近自己也在學習python, 不知道能否看得懂哈哈
我其實在machine learning是新手,如果發現有哪裡寫錯或邏輯不通XD還請多包容跟提醒我XD